#Gemini 2.5 Flash Image

5个月前

谷歌“Nano Banana”名字源于早模型漏洞。会导致模型在图像中意外插入香蕉。一开始匿名登陆LMArena，被大家发现质量过于牛x，影响太大。后谷歌承认是自家模型，虽然命名为Gemini 2.5 Flash Image，但大家还是习惯于叫Nano Banana。

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#谷歌 #nano banana #Gemini 2.5 Flash Image #模型漏洞 #LMArena

6个月前

这事你还没注意呢，巨无霸已经完成“反超时刻” 过去两年世界的主旋律就是 AI 行业，AI 行业的主旋律和明星公司自然是 OpenAI 的 GPT 了。无论是模型能力，发布节奏，还是产品化速度，品牌深入人心的影响力，GPT 一枝独秀，虽然说前三名是 OpenAI、Google 和 Anthropic，对应的模型就是 GTP、Gemini 和 Claude，但大家普遍的心智还是，二三名和第一，有代际差距，至少是落后几个月的身位。我记得 AI 搜索流行的时候，国外同行都有共识，这事对 Google 影响最大，当 Perplexity 宣布用 AI 搜索颠覆 Google 的时候，这个巨无霸是否在瑟瑟发抖呢？看起来并没有。 DeepMind 作为 Google 内部最具创新力的团队之一，很早就在基础模型、推理能力、跨模态理解等领域深耕多年。许多技术突破和算法优化，悄摸早就用在 Google 的各条产品线上了，只是大多数人并未察觉。等到 Gemini 2.5 Flash Image 发布的那一刻，才让人意识到，Google 并不是慢了一步，而是在等待一个合适的时机，这个时机甚至不是自己创造的或者 Google 营销的，而是产品自身带来的引爆点。 DeepMind 的积累和 Google 的产品能力，最终在这场 AI 的竞赛中实现了“暗中提速”，也让外界对 Google 的判断出现了偏差。如果说之前大家还在讨论“谁的模型跑得更快”，那么现在，Google 给出的答案是：不止快，更聪明。并且 Nano Banana（Gemini 2.5 Flash Image的模型代号）的速度真心不慢。上周只是生图的速度快，当时我还觉得这质量不如 GPT 啊。今天试了一下，生成的图片质量已经不分伯仲了： Google DeepMind 视觉生成产品负责人 Nicole Brichtova 在谈到这一代模型时，用了“质的飞跃”来形容。她认为，不论是图像生成，还是后续的编辑，Gemini 2.5 Flash Image 已经达到了业内的新高度。而这确实是用户亲身体验后才能感受到的震撼。 1、一致性与自然交互这代模型最令人惊讶的地方，在于它解决了长期困扰生成式 AI 的“连续性”问题。以往的图像生成工具，如果你要求它“换个角度”或者“换件衣服”，往往会生成一张完全不同的人物，就像在描述另外一个角色。而 Gemini 2.5 Flash Image 的特性是：它能在多轮自然语言交互中保持角色高度一致，这周我又试了试，一致性正在变得越来越好。你可以换动作、换服装、甚至换场景，但画面里的那个人，依然是“同一个人”。这对于创意产业、品牌设计乃至虚拟 IP 的构建，都是革命性的。更妙的是，这种交互方式不再是“冷冰冰的参数和命令”，而是接近人类自然对话的体验。模糊的表达、自由的提示，甚至一句极简的“再来一张”，模型都能理解并产出符合预期的结果。 2、从“生图”到“对话” 回想一下上周，我还觉得 nano banana 这样的模型和 GPT 之间的差距明显，而短短一周后，差距就很难分辨了。模型的进化速度，就像火箭一样，一次次把人类的想象推向更远的地方。过去我们谈 AI 图像生成，用的是“生图”这个词，意味着它像摄影一样，一次性生成一张图。现在，Gemini 2.5 Flash Image 的体验，更接近一种“对话”。你和它说话，它理解上下文，持续生成；你提出修改，它保留一致性，灵活调整。模型的“聪明程度”第一次让人觉得，它不仅仅是一个工具，而更像一个合作者。 Nicole Brichtova 在采访时说过另一句话：“我们现在看到的，只是这些模型潜力的冰山一角。” 是图像生成、角色一致性和自然语言驱动的突破，但在这些能力背后，真正令人期待的是 AI 原生的交互范式。当模型具备了跨模态的语义理解能力，它就不再局限于“输入-输出”，而是可以持续陪伴用户，完成更复杂的创作任务。这可能是一次范式转移。在 AI 时代有个和以前非常不一样的现象：纯工具没什么护城河，留给创业者的时间差非常小。很多创业公司基于之前大模型做出来的工程化产品，一旦新模型出来，你的工程化能力，直接就被新模型碾压了，这是个巨大的创业鸿沟。比如你之前基于 GPT 的 API 搞了很多工程化的算法保证角色一致性做了一个绘图工具，现在 Nano Banana 出来，你的产品立刻就会被抛弃了。用户不会有忠诚度的。但剪映这样的工具肯定不会抛弃，对吧？因为剪映做的工程化，大模型是做不了或不愿意做的。如何重新思考并建立自己的用户群和核心机制，这是创业公司必须要考虑的事。 Gemini 2.5 Flash Image 的发布，标志着 AI 进入了一个新的阶段。角色一致性、自然对话式生成和高质量的图像编辑，已经让我们看到了未来的影子。但有一点可以肯定：AI 领域的竞争不再是单点的功能对比，而是生态、交互和用户体验的全面较量。

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Gemini 2.5 Flash Image #AI 图像生成 #角色一致性 #自然语言交互 #DeepMind

6个月前

🍌nano-banana 妆面分析 + 优化建议！这可以直接做成小应用了吧（就看能不能满足姐妹们的实际需求了 ZH25O｜创意系列｜Gemini 2.5 Flash Image 【Prompt】⬇️

#nano-banana 妆面 #ZH25O #Gemini 2.5 Flash Image #妆面分析 #优化建议

6个月前

随着纳米香蕉风暴席卷全球，“火爆程度高于同期 GPT-4o”、“短时间内在 LMArena 等平台登顶”、“单日百万级互动量”，这些传说在 X 上广为流传。你看看，模型好 Google 就能瞬间翻盘。晚上总结了一下 Google 最新的顶级 AI 工具，有兴趣的都可以试试。事半功倍。 1、NanoBanana（Gemini 2.5 Flash Image） Google 最新的 AI 图像编辑工具，可通过文本提示实现高度一致的图像变换与本地精细编辑。已集成进 Gemini，是当前评价最高的图像编辑AI之一，适用于产品、时尚、社交等多种图片生成与修改场景。访问入口：或在 Gemini 应用内使用。 2、Flow（Google AI 电影制作工具）该工具集成 Veo 3、Imagen 和 Gemini，创作者可通过自然语言提示快速生成电影级场景和故事，有助于影视创作和内容生成。访问入口：，也可通过官方说明了解更多。 3、Veo 3（AI 视频生成器） Google 最新一代视频生成器，支持从文本、图片或片段生成高质量的视频，并具备逼真的视觉、动作、音频同步等功能，适合创作者和教育人士。访问入口： 4、NotebookLM（AI 数字笔记/文档助手）一款 AI 赋能的文档工具，能帮你快速分析文档、提炼要点并生成总结，现在还支持将多语种笔记直接做成视频演示，非常适合学术与内容创作者。访问入口： 5、Gemma 3（杰玛3）开源大模型这是 Google 基于 Gemini 2.0 技术推出的多模态开源 AI 模型系列，可以在个人电脑、云和移动端运行，支持 140 多种语言、文本、图片等输入，适合学术、开发和商业各种应用。官方支持 HuggingFace、Kaggle 下载以及 Vertex AI 接入。访问入口：Gemma 3 官方页｜开发文档/AI Studio｜Vertex AI 模型库 5、Project Mariner（谷歌 AI 浏览器代理/自动化助手）这是 Google 推出的下一代网页自动化智能体，可理解网页文本和视觉元素、在浏览器里自动完成多步任务（如内容抓取、填写表单、自动比价/搜索等），支持复杂的跨网页操作，目前 Ultra 订阅用户可率先体验，未来会集成进 Gemini Agent 模式。访问入口：Google Labs 演示页面｜官方介绍金秋九月，终于来了，2025，还剩四个月。 2025年9月1日

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#纳米香蕉风暴 #Google AI工具 #Gemini 2.5 Flash Image #AI电影制作 #开源大模型Gemma 3

歸藏(guizang.ai)

6个月前

谷歌在 AI Studio已经把 Gemini 2.5 Flash image的名字改成了 Nano Banana，确定按钮都改成黄色了，真会整活模型代号取代原本名字的模型这也是第一个了

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Gemini 2.5 Flash Image #nano banana #谷歌 AI Studio #模型代号 #黄色按钮

6个月前

Google 推出 Gemini 2.5 Flash Image 模型，主打原生图像生成与编辑功能，官方称其技术为"state-of-the-art"并排名全球第一,向所有用户免费开放，支持通过 Gemini App 和 Google AI Studio 访问。核心功能特性支持上传3张图片并融合创意元素人像风格转换保持主体特征（如自拍优化）文本添加、背景替换与主体修改生成内容需遵守Google内容政策，禁止侵权使用图像处理的技术优势高效架构：尽管模型体积更小，但它采用了与 Gemini 2.5 Pro 相同的突破性混合专家（Mixture-of-Experts, MoE）架构。这意味着它只针对特定任务激活神经网络中最相关的部分，使得图像处理速度极快、效率极高。超长上下文窗口：它支持实验性的 100万token 上下文窗口。虽然单张图片用不到这么多，但这允许您在单个提示中处理数十张图片或长视频，并对整个集合进行提问和分析。访问方式与配置 Gemini App：选择"2.5 Flash"模型（标注"Fast all-around help"） Google AI Studio：选择"Gemini Native Image"功能模块，需科学上网环境，当前因用户量大存在卡顿现象使用限制风格转换功能稳定性不足，部分效果需多次尝试高峰期访问存在服务器拥堵问题所有生成内容需遵守Google安全政策与版权规定

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Google #Gemini 2.5 Flash Image #图像生成 #免费开放 #AI Studio

6个月前

创下新纪录！用 Gemini 2.5 Flash Image（Nano Banana）软件将 13 张图片合并成一张图片。这拼贴方法简直太牛了！我真的很惊讶它能做到这样，不过我觉得我已经达到极限了，即使只有 13 个元素，它仍然能够保持一致性。不过，一旦你开始尝试这种海量元素，详细的提示就显得尤为重要了。🤯 提示：一位模特正靠在一辆粉色宝马上摆姿势。她穿着以下物品，场景背景为浅灰色。绿色外星人是一个钥匙扣，挂在粉色手提包上。模特肩上还有一只粉色鹦鹉。旁边坐着一只戴着粉色项圈和金色耳机的哈巴狗。

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Gemini 2.5 Flash Image #图片合并 #粉色宝马 #粉色鹦鹉 #哈巴狗

6个月前

nano banana（Gemini 2.5 Flash Image Preview）的免费使用途径： 1、AIStudio 2、Gemini APP（左上角切换模型） 3、Whisk 4、Opal 自己搭建工作流，里面可以选2.5 Flash Image，也能免费用Veo 3 5、OpenRouter

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#nano banana #Gemini 2.5 Flash Image #免费使用 #Aistudio #Veo 3

6个月前

今天试了 Google 最新的图像生成功能——“Nano-Banana”（又名 Gemini 2.5 Flash Image）。能把一张普通照片做出很细腻的多步编辑，细节挺惊艳的，干掉PS 的存在。我刚刚看 replicate 已经有这个模型 api 了，大家可以去接入用到自己的网站去。访问方式与配置 Gemini App：选择"2.5 Flash"模型（标注"Fast all-around help"） Google AI Studio：选择"Gemini Native Image"功能模块，当前因用户量大存在卡顿现象一些局限性风格转换功能稳定性不足，部分效果需多次尝试高峰期访问存在服务器拥堵问题

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Google #Gemini 2.5 Flash Image #图像生成 #AI Studio #卡顿

歸藏(guizang.ai)

6个月前

开个帖子记录一下 Gemini 2.5 Flash Image 模型我发掘的一些用法，会持续更新，建议收藏首先这个模型支持多图参考，为了你提示词好写，你可以给多张图片加上标记比如这里就是 A 的背景、B 的沙发以及 C 的人物

Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息

OpenAI新德里发布会：ChatGPT语音翻译功能引发热议· 869 条信息

#Gemini 2.5 Flash Image #多图参考 #A的背景 #B的沙发 #C的人物